用国产GPU训练AI给自己写内核,摩尔线程刷榜硬核基准
用国产GPU训练AI给自己写内核,摩尔线程刷榜硬核基准国产算力生态的难题,从此有了 AI 解。
搜索
国产算力生态的难题,从此有了 AI 解。
PE-Field将传统的2D位置编码扩展为结构化的3D场,使DiT能够更加直接地在3D空间中处理几何信息。
咱们 AI 领域,研究者既是一个身份,也是一种幻觉。
昨天,AI 圈大都被这一新闻「刷屏」:巴西里约热内卢市政府旗下的一家 IT 公司,平地一声雷地推出一款名为「Rio 3.5」397B 的开源模型,甚至还一路逆袭杀进了全球第一梯队,超越 Qwen 3.7 Plus 等开源模型,在多项基准测试中斩获 SOTA 性能。
过去很长一段时间里,AI 行业衡量模型进步的方式都相当直观:参数更大、榜单更高、推理更强、上下文更长。每一次模型发布,行业都会盯着数学、代码、知识问答和多模态基准测试,看它是否又向通用智能迈近了一步。
新智元近日对话了清华大学教授沈阳。作为长期关注 AI 应用、智能体与产业实践的学者,同时也是 ZeeLin(智灵动力)首席科学家,他个人每天的Token消耗量近10亿,本次对话围绕「自进化AI的自我递归进化」这一主线展开,讨论 AI 自进化与科研、叙事、商业与AGI相关的十个话题。
世界杯已经开打了,相信在做有很多朋友抄起了手里的大模型,遛一遛是鸭是鹅
当地时间6月11日,世界杯揭幕战墨西哥队 vs 南非队第9分钟,墨西哥队打入本届赛事首球。对于全球观众来说,这只是比赛中的一个瞬间。但这一次,人们看到的不只是传统转播画面,裁判佩戴摄像头拍摄的第一视角画面同步出现在直播信号中,球迷第一次能够从裁判的视角观察比赛。
从万众期待的「AI 封神时刻」,到美国政府一纸禁令强制下线 —— 这个名字中有 5 的模型,没活过 5 天。
随着AI Coding、Agent、Deep Research 等应用快速普及,模型单次处理的上下文长度正在从几万Token迈向几十万甚至百万Token。